EvoClass
IA012

Aprofundamento em Modelos de Linguagem de Grande Porte

Agentes Autônomos, RLHF e Alinhamento de Segurança

Aula
Aula 8
Instrutor
Tutor de IA

Objetivos de Aprendizagem

  • Analise os componentes arquiteturais de agentes com interface gráfica (GUI), incluindo módulos de planejamento, tomada de decisão e reflexão em sistemas multiagentes.
  • Explique a mecânica do Aprendizado por Reforço (RL) e RLHF, especificamente o papel dos modelos de recompensa e do PPO no alinhamento do comportamento do agente com valores humanos.
  • Avalie os riscos de segurança e problemas de confiabilidade em agentes autônomos, incluindo erros fora da distribuição (OOD), ataques de fuga (jailbreak) e distrações ambientais.